[アップデート] Amazon Q Business の一部データソースでドキュメント内の視覚要素を照会できるオプションが追加されました
いわさです。
Amazon Q Business はファイルをアップロードし、それをデータソースとして使うことが出来ます。
例えば PDF ドキュメントなどをアップロードし、ドキュメント内のテキストについて問い合わせを行うような使い方です。
これまではドキュメント内のテキストデータについてインデックスされる仕様だったのですが、本日(昨日?)のアップデートでドキュメントの内の視覚情報(図やチャートなど)についても問い合わせることが出来るようになりました。
対応しているドキュメントは以下です。
- PowerPoint
- Microsoft Word (DOCX)
- Google Slides
- Google Docs
また、対応コネクタについても一覧化されていますので最新情報は公式ドキュメントをご確認ください。
使い方
使い方は簡単で、今回の機能はオプションになるのでデータソース作成時にそのオプションを有効化するだけです。
以下の「Advanced indexing」の「Visua content in documents」を有効化します。
あとは Q Business アプリケーション上で視覚要素について質問するだけです。
ちなみに、テキストコンテンツであれば上記の「Default indexing」についてインデックス化されます。試してみますか。
以下は Well-Architected Tools のレポートです。
上記の Review Owner を取得してみましょう。
非常に単純な問い合わせですが、期待した結果を得ることが出来ました。
今回追加されたオプションを使わなくてもドキュメント内のテキストデータについてはサポートされていることが確認できます。
設定
今回は次の AWS ブログを PDF 出力したものをアップロードしてみたいと思います。
このページでは様々な図やチャートが使われています。
その中の以下の円グラフに対して問い合わせをしてみましょう。
今回はデータソースにアップロードファイルを使います。
冒頭のサポートコネクタには含まれていないのですがオプションがあったので問題ないと判断して検証してみました。
割愛しますが、先程紹介した「Visual content in documents」を有効化してアップロードします。
問い合わせしてみましょう。円グラフの中から 2 番目に大きい要素について聞いてみました。
MacOS X であり、19.32 % を占めている旨回答されました。
さらに回答の根拠となったグラフ部分が引用されています。とても良いんじゃないですか。
ちなみに他のコネクタでも設定箇所は同じ名称です。
展開しないと表示されないものもあったのでご注意ください。
さいごに
本日は Amazon Q Business の一部データソースでドキュメント内の視覚要素を照会できるオプションが追加されたので試してみました。
これはとても良いですね。
よりデータソースの情報量が多くなり、回答品質が上がりそうです。
この機能は追加料金が発生しまして、処理された画像またはグラフなどの数による従量課金となっています。その点だけご注意ください。